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Optimierte Proteinsynthese 

Beschreibung 



Die Erfindung betrifft ein Verfahren zur optimierten Herstellung von 
Proteinen in einem in vitro oder in vivo Expressionssystem sowie dafur 
geeignete Reagenzien. 

Hannig, G. & Makrides, S.C, (1998) Tibtech Vol 16, pp 54-60, haben 
Strategien zur Optimierung der heterologen Proteinexpression in E. coli 
beschrieben. Ein entscheidender Faktor ist hierbei die Effizienz der Initiation 
der Translation- Die Verwendung bestimmter Codons spielt hierbei eine 
gewisse Rolle. So konnten George et al. (1985) DNA Vol 4, pp 273-281, 
zeigen, dass die Expression eines heterologen Genes gesteigert werden 
kann, wenn man in dem Bereich nach dem Startcodon solche Codons 
verwendet, die in E. coli Genen haufig benutzt werden. Besonders wichtig 
fur die Translations-Initiation sind hauptsachlich strukturelle Elemente am 
5'-Ende der mRNA. Von Makrides (1 996) Microbiol. Rev. Vol 60, pp 512- 
538, wurden verschiedene Translations-Verstarker-Sequenzen, wie 
beispielsweise eine Sequenz aus dem T7-Phagen Gen 10 Leader und eine 
U-reiche Sequenz aus der 5 '-untranslatierten Region einiger mRNA 's, wie 
beispielsweise des E. coli atpE Gens, beschrieben. 

Bislang wurden keine universell einsetzbaren Translations- 
Initiationssequenzen beschrieben. Es wurden jedoch Strategien 
beschrieben, die das Potential der Sekundarstruktur-Bildung am 5'-Ende 
der mRNA reduzieren. Insbesondere wurde die Ribosomen-Bindungsstelle 
mit Adenin und Thymin Bausteinen angereichert. Stenstom et al. (2001) 
Gene Vol 263, pp 273-284, zeigten, dass stark exprimierte E. coli Gene 
insbesondere bei dem dem Startcodon fblgenden + 2 Codon einen hohen 
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Gehalt an Adeninen aufweisen. Allerdings gibt es auch fur diese Regel viele 
positive und negative Ausnahmen. 

SchlieBlich zeigten Pederson-Lane et al. (1997) Protein Expr. Purif. Vol 10, 
pp 256-262, dass ein hoher GC-Gehalt unmittelbar nach dem Startcodon 
negativ fur die Expression ist und mit Konversion der Purin Basen des 3., 4. 
und 5. Codons gegen Thymidin Basen die Expression der 
Thymidylatsynthase auf 25 % des Gesamtproteins gesteigert werden 
konnte. 

Es wird angenommen, dass bei all diesen Mafcnahmen die Zugangigkeit der 
30S Ribosomenuntereinheit zu der messenger RNA eine entscheidende 
Rolle spielt. Besonders wichtig ist hierbei der freie Kontakt an die nach 
Shine und Dalgarno benannte Sequenz unmittelbar vor dem Startcodon und 
der Kontakt zu dem Startcodon selbst. Sind hingegen diese 
Sequenzelemente in stabilen RNA-Sekundarstrukturen gebunden, so lauft 
die Initiation der Translation sehr ineffizient. Tessier et al. (1984) Nucl. Ac. 
Res. Vol 12, pp 7663-7675, zeigten in einer systematischen 
Untersuchung, dass durch eine gezielte Mutation diese Form von 
Stammchen und Schleifen (sogenannten Stem-Loops Oder Hairpin-Loops) 
ahnelnden Sekundarstrukturen aufgelost und damit die Effizienz der 
Translation erheblich gesteigert werden kann. Der Effekt dieser 
Sekundarstrukturen auf die Translation kann nach deren 
thermodynamischen Parametern berechnet werden. So bewirkt eine 
Stabilisierung um 1,4 kcal/mol eine 10fache Reduzierung der Expression 
{Gold (1988) Ann. Rev. Biochem, Vol 57, pp 199-233) und eine 
Stabilisierung um 2,3 kcal/mol reduziert die Bindung des Ribosoms um eine 
GrdfJenordnung (de Smit & van Duin (1994) J. Mol. Biol. Vol 244, pp 144- 
150). 



Von Sprengart et al. (1 996) EMBO Vol 1 5, pp 665-674, wurde als weiterer 
Translations-Verstarker die sogenannte „Downstream Box", ein 
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Sequenzelement direkt nach dem Startcodon der T7-Gene mit Homologie 
zur ribosomalen 16S RNA beschrieben. Es wird angenommen, dass dieses 
Element durch eine Wechsewirkung der beiden homologen Basenpaare die 
Bindung der 30S Ribosomenuntereinheit verstarkt. Allerdings eignet sich 
auch dieses Element nicht als universeller Translations-Verstarker. 

Die Nachteile bekannter Verfahren liegen darin, dass fur jedes neue Gen 
eine Optimierung der 5 '-Region der mRNA entweder in der 5'- 
untranslatierten Region oder in der translatierten Region durchgefuhrt 
werden muss, um die Codon-Verwendung zu optimieren, oder 
unerwunschte Sekundarstrukturen der mRNA mit Auswirkung auf die 
Shine-Dalgarno Sequenz oder das Startcodon zu vermeiden. Dies bedarf im 
Regelfall einer aufwandigen Analyse der RNA-Struktur mit entsprechenden 
Programmen (z.B. Mukund et al. (1999) Curr. Science Vol 76, pp 1486- 
1490, oder Jaeger et al. (1990) Meth. Enzymol. Vol 183, pp 281-306), 
sowie mehrerer PCR-Amplifikationen und Klonierungsschritte. Will man auf 
diese Weise eine grofce Anzahl von Genen, beispielweise aus einer 
Genbank exprimieren, so ist dazu in jedem Falle eine genaue Kenntnis der 
Sequenz erforderlich, weshalb diese Methoden nicht auf unbekannte Gene 
angewendet werden konnen. Selbst bei Kenntnis der Sequenzen ware 
dieses Verfahren wesentlich aufwandiger als eine universell anwendbare 
Methode. 

Ein weiterer Ansatz zur Verstarkung der Translation besteht darin, als 
universellen Translations-Enhancer ein Fusionsprotein mit einem stark 
exprimierten Gen zu bilden, an dessen C-terminales Ende das gewunschte 
Gen gesetzt wird. Als Beispiel fur den Erfolg dieser Strategie ist die Fusion 
mit dem Ubiquitin Gen zu nennen, wie sie von Butt et al. (1989) PNAS Vol 
86, pp 2540-2544, durchgefuhrt wurde. 

Auch dieser Ansatz kann jedoch nicht ohne Weiteres auf die Expression 
beliebiger Gene iibertragen werden. Werden namlich Fusionsproteine 
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verwendet, so wird am N-Terminus des Proteins eine mehr oder weniger 
grofce Fusion angefiigt, die aufgrund der GroSe und Eigenschaften des 
Fusionspartners mit der Funktion des gewiinschten Proteins interferieren 
konnen. Je kleiner die Fusionsproteine oder Teile von diesen gewahlt 
werden, desto geringer ist in vielen Fallen auch deren 
translationssteigernde Wirkung. Bei grofcen Fusionsproteinen zeigt sich ein 
weiterer Nachteil prokaryontischer Expressionssysteme: Es steigt 
gleichzeitig die Wahrscheinlichkeit fur unvollstandige Transkription oder 
Translation durch vorzeitige Termination oder interne Initialisierung. Auch 
die Wahrscheinlichkeit fur proteolytischen Abbau ist erhoht. 

Es besteht somit ein Bedurfnis, ein Verfahren zur optimierten Herstellung 
von Proteinen bereitzustellen, bei dem die Nachteile des Standes der 
Technik zumindest teilweise beseitigt sind. 

Ein Gegenstand der Erfindung ist ein Verfahren zur Herstellung eines 
Proteins, umfassend die Schritte: 

(a) Bereitstellen einer fur das Protein kodierenden Nukleinsauresequenz, 
wobei 3'-seitig des Translations-Startcodons eine heterologe 
Nukleinsauresequenz im korrekten Leseraster eingefugt wird, die so 
gewahlt wird, dass in einem Abstand von 6-30 Nukleotiden 3'-seitig 
des Translations-Startcodons eine Stem-Loop-Struktur ausgebildet 
wird, 

(b) Bereitstellen eines zur Expression des Proteins geeigneten 
Expressionssystems und 

(c) Einbringen der Nukleinsauresequenz gemaft (a) in das 
Expressionssystem gemalS (b) unter Bedingungen, dass das Protein 
synthetisiert wird. 

Die erfindungsgemafce Losung fur ein universell optimiertes 
Expressionskonstrukt besteht darin, dass ein kleines heterologes 
DNA-Sequenzelement mit vorzugsweise maximal 201 Basenpaaren, 
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besonders bevorzugt maximal 45 Basenpaaren, unmittelbar nach dem 
Startcodon des zu exprimierenden Gens eingefugt wird, welches die 
Ausbildung stabiler Stem-Loop-Strukturen im Bereich der Shine-Dalgamo- 
Sequenz und des Startcodons weitgehend verhindert und dadurch zur 
optimierten Translations-Initiation und optimierter Proteinsynthesefuhrt. Es 
wird somit ein Fusionsprotein gebildet, wobei vorzugsweise nur ein kleines 
Peptid mit maximal 67 Aminosauren und besonders bevorzugt maximal 1 5 
Aminosauren an das gewiinschte Protein angefugt wird. 

Eine wichtige Vorraussetzung fur das heterologe DNA-Sequenzelement ist, 
dass es im korrekten Leseraster eingefugt wird, d.h. dass keine 
Rasterverschiebung im zu exprimierenden Gen stattfindet. Eine weitere 
wichtige Eigenschaft des heterologen DNA-Sequenzelements ist, dass sich 
in der transkribierten RNA in einem Abstand von 6-30 Basen, vorzugsweise 
12-21 Basen, hinter dem Startcodon eine stabile Stem-Loop-Struktur 
ausbilden kann, wobei die Basenpaarung in der Stem-Loop-Struktur 
zumindest teilweise durch die eingefugte Sequenz bewirkt wird. Diese 
Stem-Loop-Struktur soil so beschaffen sein, dass sie nach der erfolgten 
Initiation der Translation durch das Ribosom wieder aufgelost werden kann 
und somit nicht zu einem Abbruch der Translation fiihrt. Diese durch 
Einfuhrung der heterologen Nukleinsauresequenz in das 
Expressionskonstrukt entstandete Stem-Loop-Struktur kann sich bei nahezu 
jedem Gen in der gleichen Weise ausbilden und dadurch verhindern, dass 
die fur die Translations-Initiation wichtigen Sequenzen vor dem Loop 
groBere Sekundarstrukturen mit der kodierenden Sequenz des Gens 
eingehen konnen. Der Bereich unmittelbar vor dieser Stem-Loop-Struktur 
und nach dem Startcodon ist vorzugsweise eine Sequenz ohne 
Sekundarstruktur und kann auch keine Sekundarstruktur mit der 
5 '-untranslatierten Region ausbilden. Besonders bevorzugt ist in dieser 
Region eine GC-arme Sequenz, da bei einer derartigen Sequenz die 
Ausbildung stabiler Sekundarstrukturen mit Sequenzen innerhalb der 
translatierten Region minimiert wird. 
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Das heterologe Nukleinsaure-Sequenzelement kann in die Zielsequenz, z.B. 
in einen Plasmidvektor zur Expression von heterologen Genen mit 
bekannten Klonierungs- oder/und Amplifikationstechniken eingefugt 
werden. Moglich ist z.B. der Aufbau dieser Sequenz durch PCR-Primer zur 
Klonierung des gewiinschten Gens oder durch Primer, mit denen DNA- 
Expressionskonstrukte fur die in vitro Proteinexpression hergestellt werden. 

Das erfindungsgema&e Verfahren kann zur Herstellung und gegebenenfalls 
Gewinnung von Proteinen in in vitro Expressionssystemen eingesetzt 
werden. Beispiele fur geeignete in vitro Expressionssysteme sind 
prokaryontische in vitro Expressionssysteme, wie etwa Lysate von gram- 
negativen Bakterien, beispielsweise von Escherichia coii, oder gram- 
positiven Bakterien, wie beispielsweise Bacillus subtilis, oder 
eukaryontische in vitro Expressionssysteme, wie etwa Lysate von 
Saugerzellen, wie beispielsweise von Kaninchen, Reticulocyten, humanen 
Tumorzelllinien, Hamsterzelllinien, oder anderen Wirbeltierzellen, wie 
beispielsweise Oozyten und Eiern von Fischen und Amphibien, sowie 
Insektenzelllinien, Hefezellen, Algenzellen oder Extrakte aus 
Pflanzenkeimen. 



Alternativ kann die Herstellung des Proteins in einem in vivo 
Expressionssystem erfolgen, wobei eine prokaryontische Zelle, z.B. eine 
gram-negative prokaryontische Wirtszelle, insbesondere eine E. coli Zelle, 
oder eine gram-positive prokaryontische Zelle, insbesondere eine Bacillus 
subtilis Zelle, eine eukaryontische Wirtszelle, z.B. eine Hefezelle, eine 
Insektenzelle oder eine Wirbeltierzelle, insbesondere eine Amphibien-, 
Fisch-, Vogel- oder Saugerzelle, oder ein nicht-humaner eukaryontischer 
Wirtsorganismus als Expressionssystem verwendet werden kann. 

Die Einfiihrung der heterologen Nukleinsaure-Sequenz in die fur das 
gewiinschte Protein kodierenden Nukleinsaure-Sequenz kann durch 
Standardmethoden der Molekularbiologie, z.B. durch Klonierung, wie etwa 
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Restriktionsspaltung oder/und Ligation, durch Rekombination oder/und 
durch Nukleinsaureampiifikation erfolgen. Die Nukleinsaure-Zielsequenz 
kann dabei auf einem geeigneten Vektor, z.B. einem Plasmidvektor zur 
Expression von heterologen Genen, oder auf einem Konstrukt fur eine in 
vitro Proteinexpression vorliegen. Besonders bevorzugt ist eine 
Nukleinsaureampiifikation in einem oder mehreren Schritten, wobei durch 
Auswahl geeigneter Primer die heterologe Nukleinsauresequenz und 
gegebenenfalls Expressionskontrollsequenzen, wie etwa Promotor, 
ribosomale Bindungensstellen und Terminatoren, an die fur das gewunschte 
Protein kodierende Nukleinsaure-Sequenz angefiigt werden. Besonders 
bevorzugt ist eine Zweistufen-PCR, wobei in einer ersten Stufe zumindest 
ein Teil der heterologen Nukleinsaure-Sequenz an eine Nukleinsaure- 
Zielsequenz, die fur das gewunschte Protein kodiert, und in einem zweiten 
Schritt Expressionskontrollsequenzen angefiigt werden. Eine bevorzugte 
Ausfuhrungsform zur Durchfuhrung einer Zweischritt-PCR ist in den 
Beispielen exemplarisch dargestellt. 

Die heterologe Nukleinsaure-Sequenz, die in der Lage ist, eine Stem-Loop- 
Struktur 3'-seitig des Translations-Startcodons auszubilden, wird im 
korrekten Leseraster 3'-seitig des Translations-Startcodons, ublicherweise 
des ersten ATG-Codons, in die fur das gewunschte Protein kodierende 
Nukleinsaure-Sequenz eingefugt. Vorzugsweise erfolgt die EinfCigung in 
einem Abstand bis zu 6 Nukleotiden, besonders bevorzugt unmittelbar nach 
dem Translations-Startcodon. Eine Einfugung im "korrekten Leseraster" 
bedeutet dabei, dass keine Verschiebung des Leserahmen in der Protein- 
kodierenden Nukleinsaure-Sequenz erfolgt. Dies bedeutet wiederum, dass 
die Lange der heterologen Nukleinsaure-Sequenz in Nukleotiden ein 
Vielfaches von 3 ist. Bevorzugt ist die Lange im Bereich von 6-201 
Nukleotiden, besonders bevorzugt im Bereich von 1 2-45 Nukleotiden. 

Die Einfugung der heterologen Nukleinsaure-Sequenz in die Protein- 
kodierende Nukleinsaure-Sequenz erfolgt derart, dass eine Stem-Loop- 
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Struktur in einem geeigneten Abstand 3'-seitig des Translations-Codons 
ausgebildet wird. Der Abstand (zwischen dem letzten Nukleotid des 
Translationsstart-Codons und dem ersten Nukleotid des Stem) betragt 
gunstigerweise 6-30 Nukleotide, besonders bevorzugt 12-21 Nukleotide. 
5'-seitig derjenigen Sequenzen, die fur die Bildung der Stem-Loop-Struktur 
vorgesehen sind, enthalt die heterologe Nukleinsaure-Sequenz 
vorzugsweise einen AT-reichen Bereich, d.h. einen Bereich mit einem AT- 
Gehalt >50 %, insbesondere >60 %. 

Die Lange des Stems in der Stem-Loop-Struktur liegt vorzugsweise im 
Bereich von 4 bis 12 Nukleotiden, besonders bevorzugt von 5 bis 10 
Nukleotiden. Der Stem der Stem-Loop-Struktur enthalt vorzugsweise zwei 
vollstandig zueinander komplementare Abschnitte. Es konnen jedoch auch 
ein oder mehrere Basenfehlpaarungen vorhanden sein, sofern dadurch die 
Stabilitat nicht zu stark verringert wird. Die Basenpaarungen im Stem 
konnen AT- und GC-Basenpaarungen und Kombinationen davon sein. Ein 
Anteil der GC-Basenpaarungen von >50 % ist bevorzugt. Die Lange des 
Loops betragt vorzugsweise 2 bis 8 Nukleotide, sie ist jedoch nicht 
sonderlich kritisch. Die thermodynamische Stabilitat der Stem-Loop- 
Struktur ist zweckmafcigerweise hoch genug, dass die Ausbildung einer 
Sekundarstruktur im Bereich des ATG-Startcodons, der 15 5'-liegenden 
Nukleotide, welche die Shine-Dalgarno-Sequenz beinhalten, und mindestens 
der 5 3'-befindlichen Nukleotide verhindern. Andererseits sollte die 
thermodynamische Stabilitat der Stem-Loop-Struktur nicht so hoch sein, 
dass die Prozessierung des Ribosoms auf der mRNA behindert wird. 
Vorzugsweise liegt die thermodynamische Stabilitat der Stem-Loop-Struktur 
im Bereich von -4 bis -1 5 kcal/mol. 

Die zur Expression des gewiinschten Proteins verwendeten 
Expressionskontrollsequenzen umfassen Promotoren, ribosomale 
Bindungsstellen, d.h. Shine-Dalgarno-Sequenzen fur prokaryontische 
Expressionssysteme bzw. Kozak-Sequenzen fur eukaryontische 
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Expressionssysteme, Enhancer, Terminatoren, Polyadenylierungs- 
Sequenzen etc. Dem Fachmann sind entsprechende 
Expressionskontrollsequenzen aus Standardlehrbuchern der 
Molekularbiologie, z.B. Sambrook et al. (1989) Molecular Cloning, A 
Laboratory Manual, Cold Spring Harbor oder Ausubel et al. (1 989) Current 
Protocols in Molecular Biology, John Wiley & Sons, New York, bekannt. 

Weiterhin kann die heterologe Nukleinsauresequenz auch Abschnitte 
enthalten, die fur eine Aufreinigungsdomane, z.B. eine Poly-His-Domane, 
eine FLAG-Epitop-Domane etc., oder/und fur eine Proteinase- 
Erkennungsdomane, z.B. eine IgA-Protease- oder Faktor-X-Domane, 
kodieren. Durch die Aufreinigungsdomane kann die Gewinnung des 
gewiinschten Proteins, z.B. aus einem in vitro Translationsansatz oder einer 
Wirtszelle bzw. dem zur Kultivierung verwendeten Medium, vereinfacht 
werden. Durch Protease-Spaltung innerhalb der Protease- 
Erkennungsdomane kann die heterologe Peptidsequenz von dem 
gewiinschten Protein abgespalten werden. 

Die heterologe Nukleinsauresequenz oder/und die fur das gewunschte 
Protein kodierende Nukleinsauresequenz werden - um eine weitere 
Verbesserung der Expressionshohe zu erreichen - gunstigerweise so 
gewahlt, dass sie zumindest teilweise eine an das jeweilige 
Expressionssystem angepasste Codon-Nutzung aufweisen. 

Ein weiterer Gegenstand der Erfindung ist ein Reagenz zur Herstellung eines 
Proteins, umfassend 

(a) eine zu der fur das gewunschte Protein kodierenden 
Nukleinsauresequenz heterologe Nukleinsauresequenz, die im 
korrekten Leseraster in die Protein-kodierende Nukleinsauresequenz 
eingefugt werden kann, und die in einem Abstand von 6-30 
Nukleotiden 3'-seitig des Translations-Startcodons eine Stem-Loop- 
Struktur ausbilden kann, und 
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(b) ein zur Herstellung des Proteins geeignetes Expressionssystem. 



Die heterologe Nukleinsauresequenz kann in Form einer vollstandigen 
Sequenz oder in Form von mehreren Teilsequenzen voriiegen. 

Das erfindungsgemaBe Verfahren und Reagenz sind insbesondere fur die 
Synthese von Proteinen schwer exprimierbarer Gene sowie der Synthese 
von Proteinen ausgehend von Genbanken anwendbar, da hierbei die 
Erfolgsrate gegenuber der bei der Verwendung ublicher 
Expressionsvektoren gesteigert werden kann. 

Weiterhin soli die vorliegende Erfindung durch die nachfolgenden 
Abbildungen und Beispiele naher erlautert werden. 

Es zeigen: 

Figur 1 eine schematische Darstellung der zur Durchfuhrung einer 
Zweischritt-PCR notwendigen Nukleinsaure-Sequenzelemente; 

Figur 2 eine schematische Darstellung von unterschiedlich langen Stem- 
Loop-Strukturen in zur Einfugung in GFP Expressionkonstrukte 
verwendeten heterologen Nukleinsaure-Sequenzen; 

Figur 3 eine Auswertung der Ergebnisse bei der Expression von GFP unter 
Verwendung der Hairpin-Loop-GFP-Konstrukte gemaR Figur 3 in einem 
RTS-Expressionssystem. 1 jj\ jedes Ansatzes (Doppelbestimmungen) wurde 
elektrophoretisch uber SDS-PAGE aufgetrennt und auf eine PVDF-Membran 
geblottet. Die Detektion erfolgte uber DCP-Star und Lumi-lmager; 



Figur 4 eine schematische Darstellung von unterschiedlichen positionierten 
Stem-Loop-Strukturen in zur Einfugung von GFP-Expressionskonstrukte 
verwendeten heterologen Nukleinsauresequenzen; 
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Figur 5 die Expression von GFP unter Verwendung der in Figur 4 
dargestellten heterologen Nukleinsaure-Sequenzen. Die Durchfuhrung und 
Auswertung der Ansatze erfolgte wie in der Legende zur Figur 3 
beschrieben; 

Figur 6 eine Auswertung der Ergebnisse bei der Expression des CIITA Gens 
(Wildtyp: Spur 1; Mutanten Spuren 2-10) unter Verwendung 
unterschiedlicher heterologer Nukleinsauresequenzen mit Stem-Loop- 
Strukturen; 

Figur 7 eine Auswertung der Ergebnisse bei der Expression des CMV 
Capsid (1049) Gens (Wildtyp: Spur 1; Mutanten Spuren 2-10) unter 
Verwendung unterschiedlicher heterologer Nukleinsauresequenzen mit 
Stem-Loop-Strukturen; 

Figur 8 eine Auswertung der Ergebnisse bei der Expression des Survivin 
Gens (Wildtyp: Spur 10; Mutanten Spuren 1-9) unter Verwendung 
unterschiedlicher heterologer Nukleinsauresequenzen mit Stem-Loop- 
Strukturen; 

Figur 9 eine Auswertung der Ergebnisse bei der Expression des GFP Gens 
(Wildtyp: Spur 10; Mutanten Spuren 1-9) unter Verwendung 
unterschiedlicher heterologer Nukleinsauresequenzen mit Stem-Loop- 
Strukturen; 

Figur 10 eine Auswertung der Ergebnisse bei der Expression des GFP und 
des 1049 Gens unter Verwendung unterschiedlicher heterologer 
Nukleinsauresequenzen mit und ohne Stem-Loop-Strukturen; 

Figur 1 1 eine Auswertung der Ergebnisse bei der Expression des CIITA und 
des Survivin Gens unter Verwendung unterschiedlicher heterologer 
Nukleinsauresequenzen mit und ohne Stem-Loop-Strukturen; 
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Figur 12 eine schematische Darstellung von zwei unterschiedlichen Stem- 
Loop-Strukturen in den erfindungsgemafcen heterologen Sequenzen; 

Figur 13 eine Auswertung der Ergebnisse mit den in Figur 12 gezeigten 
Stem-Loop-Strukturen; 

Figur 14 eine Darstellung der in vivo Protein Expression von RNA-Stem- 
Loop-Kontrukten im Vergleich zu den Wildtyp-Genen im Western Blot. 
Expression von drei unabhangigen Klonen der RNA-Stem-Loop-Mutanten 
des CMV Kapsid Proteins 1049 (Spur 1 bis 3) und des CMV Kapsid 
Proteins 1049 Wildtyp (Spur 4 bis 6), Expression von unabhangigen Klonen 
von Survivin RNA-Stem-Loop-Mutanten (Spur 7 bis 9) und des Survivin 
Wildtyps (Spur 10,11). 

Beispiele 

Beispiel 1: Zweischritt-PCR 



Mit Hilfe einer Zweischritt-PCR konnen zu exprimierende Gene amplifiziert 
und mit den entsprechenden Kontrollregionen, wie T7-Promotor, T7 
Gen10-Leader (g10), Ribosomaler Bindungsstelle (RBS) und T7-Terminator, 
versehen werden. Im ersten Schritt wird mittels eines Paares von Primern 
(A, B), die jeweils auf 15 Basen Lange mit dem entsprechenden Gen 
komplementar sind und 1 5 weitere Basen enthalten, die komplementar zu 
einem zweiten Primerpaar (C, D) sind, das Gen amplifiziert. Das zweite 
Primerpaar enthalt alle wichtigen regulatorischen Elemente, die somit bei 
einer zweiten PCR-Amplifikation an das Gen angehangt werden (siehe Figur 
1). 

Uber den A-Primer konnen bei dieser Methode Veranderungen im 
5 '-Bereich des Gens eingefuhrt werden. Bei den Hairpin-Loop-Konstrukten 
wurden uber diesen A-Primer Hairpin-Loops mit unterschiedlicher Lange des 
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Hairpin-Loop-Stamms und in unterschiedlicher Position hinter dem 
Start-Codon in die Gen-Sequenz inseriert. 



Primer C (SEQ ID NO. 1) 

T7-Promotor 

5 ' -G A AATTAATAC^ACJTCACTATAGGG AG ACC ACAACGGTTTCCCTCT 

qlO RBS 
AGAAATAATTTTG TTTAACTTT AAG AAGGAGA TATACC-3 ' 



Komplementar zu A 



Primer D (SEQ ID NO. 2) 



T7-Terminator 

5 '- CAAAAAACCCCTCAAGACCCGTTTAGAGGCCCCAAGGGG GGCCGC 



CAGTGTGCTGAATTCGCCTTTTATTA-3 ' 

Komplementar zu B 



Reaktionsbedinqunaen 

Die PCR-Reaktionen wurden iiblicherweise nach folgendem Schema mit 
dem Expand High Fidelity Kit (Roche Applied Science) im 50 //I MaRstab 
durchgefuhrt: 



PCR 1 : Template 1 Ong/Ansatz; Primer A 20 pmol/Ansatz; Primer B 
20 pmol/Ansatz 

95 °C 5 min + 20 mal (95 °C 1 min + 55 1 min + 72 °C 
1 min) + 4 °C 

PCR 2: 2 fj\ PCR 1 ; Primer C 20 pmol/Ansatz; Primer D 20 
pmol/Ansatz 

95 'C 5 min + 30 mal (95 °C 1 min + 50 *C 1 min + 
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72 °C 1 min) + 72 °C 10 min +4 °C 



Beide PCR-Reaktionen wurden jeweils durch Agarose-Gel-Elektrophorese 
uberpriift und die PCR-Produkte der PGR 2 gleichzeitig mit Hilfe eines 
DNA-Langenstandards, welcher definierte DNA-Mengen enthalt, im Lumi- 
Imager-System quantifiziert. Die daraus erhaltenen PCR-Produkte wurden 
direkt als Template in RTS-Expressions-Ansatzen eingesetzt. 



Beispiel 2: Expression mit dem RTS in vitro Expressionssystem 

Die Expressionen mit dem RTS 100 HY Kit (Firma Roche Applied Science) 
wurden in Batch-Ansatzen zu je 50 //I nach der dem Kit beiliegenden 
Anleitung durchgefCihrt. Dabei wurden DNA-Mengen von 0,25-1 fjg pro 
Reaktions-Ansatz eingesetzt. Um die Ergebnisse einer Versuchsreihe 
vergleichen zu konnen, wurden immer gleiche Mengen des jeweiligen 
Templates eingesetzt. Die Ansatze wurden bei 30 °C fur 4 h inkubiert. 



Beispiel 3: Expression von Hairpin-Loop-GFP-Konstrukten 

Es wurde am Beispiel von GFP (Grun-Fluoreszenz-Protein) untersucht, 
welchen Einfluss Hairpin-Loops (Haarnadel-formige Schleifen) in der mRNA 
direkt nach dem Start-ATG austiben. Dazu wurden RNA-Sequenzen 
ermittelt, die Hairpin-Loops (HL) mit unterschiedlichen Stammlangen 
ausbilden. Je langer der Stamm des Hairpin-Loops ist f um so energetisch 
stabiler ist diese Struktur. Bei der Erstellung der Hairpin-Loops wurde 
darauf geachtet, dass nur in £. colt Genen haufig zu findende Codons 
verwendet wurden. Die ermittelten Sequenzen fur die verschiedenen 
Hairpin-Loops wurden mittels mRNA-Sekundarstrukturanalyse auf ihre 
Stabilitat im gesamten Konstrukt hin uberpruft. Fur Sequenzen, die 
genugend Stabilitat aufwiesen, wurden Primer erstellt, die in der 
beschriebenen Zweischritt-PCR gemafi Beispiel 1 eingesetzt wurden. 
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Primer A: 

ohne Hairpin-Loop (SEQ ID NO. 3) 

Komplementar zu C GFP 
5 '-AGGAGATATACCATGACTAGCAAAGGAGAA-3 ' 

Stammlange 4 bp (SEQ ID NO.4) 

Komplementar zu C HL 4 bp GFP 
5 '-AGGAGATATACCATGACTAATTTTAGTACTAGCAAAGGAGAA-3 ' 

Stammlange 5 bp (SEQ ID NO. 5) 

Komplementar zu C HL 5 bp GFP 

5 '-AGGAGATATACCATGACTGTTTATACAGTAACTAGCAAAGGAGAA-3 ' 

• Stammlange 6 bp (SEQ ID NO. 6) 

Komplementar zu C HL 6 bp GFP 

5 '-AGGAGATATACCATGACTGGTCAATTACCAGTAACTAGCAAAGGAG 
AA-3' 

Stammlange 7 bp (SEQ ID NO. 7) 

Komplementar zu C HL 7 bp GFP 

5 ' -AGGAG ATATACCATGACTGCTTTAC ATC AAGCAGTAACTAGCAAAG 
GAGAA-3 ' 

Stammlange 8 bp (SEQ ID NO. 8) 

Komplementar zu C HL 8 bp GFP 

5 '-AGGAGATATACCATGACTGCACGTGATCGTGCAGTAACTAGCAAAG 
GAGAA-3 ' 



Primer B (SEQ ID NO. 9) 

Komplementar zu D GFP 
5 ' -ATTCGCCTTTTATTAATGATGATG ATG ATG-3 ' 
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Eine schematische Darstellung der mRNA-Sekundarstrukturen der Hairpin- 
Loop-GFP-Konstrukte ist in Figur 2 gezeigt. 

RTS Expression 

Nach Expression im RTS gemaB Beispiel 2 wurde zur Verifizierung die 
gebildete GFP-Menge im Fluorimeter gemessen und der Western-Blot 
mittels CDP-Star-Detektion und Auswertung im Lumi-lmager quantitativ 
analysiert. Die Ergebnisse sind in Figur 3 gezeigt. 

Es ist eindeutig erkennbar, dass die Expressionsrate mit der Stammlange 
des Hairpin-Loops variiert. Bis zu einer Stammlange von 5 bp ist die 
Expressionsrate relativ konstant, um dann anschliefcend abzufallen. Bei 
einer Stammlange von 8 bp ist nahezu keine Expression mehr nachweisbar. 
Diese Untersuchungen bestatigen die oben erhaltenen Ergebnisse. Man 
kann also sagen, dass ein Hairpin-Loop mit einer Stammlange ab 6 bp oder 
besser mit einer Freien Energie von -7,8 kcal/mol eine Struktur darstellt, 
die einen erheblichen Einfluss auf die Expression ausubt. Zu erklaren ist 
dies damit, dass diese Struktur bei den Expressionsbedingungen stabil ist 
und somit das vorgelagerte Start-ATG nicht frei zuganglich ist. 

Beispiel 4: Ermittlung des minimalen Abstandes zum Start-ATG 

Um nun zu bestimmen, bis zu welchem Abstand ein solcher Hairpin-Loop 
einen Einfluss auf die Expression ausubt, wurde der Hairpin-Loop mit der 
Stammlange 8 bp (Energie -1 1 ,8 kcal/mol) in Schritten zu je 3 Basen vom 
Start-ATG weg in die GFP-Sequenz verschoben. Die Sequenzen der auf 
diese Weise erhaltenen A-Primer war wie folgt: 

Stammlange 8 bp, 6 Basen in die GFP-Sequenz hineinverschoben (SEQ ID 
NO. 10): 

HL 8 bp GFP 
5 '-AGG...ATGACTAGCACT...GTAAAAGGAGAAGAACTT-3 ' 
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Stammlange 8 bp, 9 Basen in die GFP-Sequenz hineinverschoben (SEQ ID 
NO. 11): 

HL 8bp GFP 
5 '-AGG...ATGACTAGCAAAACT...GTAGGAGAAGAACTTTTC-3 ' 

Stammlange 8 bp, 12 Basen in die GFP-Sequenz hineinverschoben (SEQ ID 
NO. 12): 

HL 8 bp GFP 
5 ' -AGG.. . ATGACTAGCAAAGG AACT. . .GTAG AAG AACTTTTC ACT-3 ' 



Stammlange 8 bp, 15 Basen in die GFP-Sequenz hineinverschoben (SEQ ID 
NO. 13): 

HL 8 bp GFP 
5 ' - AGG . . . ATGACTAGC AAAGGAG AAACT. . .GTAG AACTTTTCACTGGA-3 ' 

Stammlange 8 bp, 18 Basen in die GFP-Sequenz hineinverschoben (SEQ ID 
NO. 14): 

HL 8 bp GFP 
5 ' -AGG . . . ATGACTAGC A A AG GAG AAGAAACT.. .GTACTTTTCACTGGAG 
TT-3' 

Stammlange 8 bp, 21 Basen in die GFP-Sequenz hineinverschoben (SEQ ID 
NO. 15): 

HL 8bp GFP 

5 '-AGG...ATGACTAGCAAAGGAGAAGAACTTACT...GTATTCACTGGAG 
TTGTC-3 ' 



Diese DNA-Konstrukte mit den in Figur 4 gezeigten Sekundarstrukturen 
wurden ebenfalls uber Zweischritt-PCR mit den zuvor beschriebenen 



WO 2004/053053 




T7EP2003/013964 



- 18 - 



Primern B, C und D synthetisiert und direkt aus der PCR-Reaktion in 
Expressionsansatzen als Template eingesetzt. Dabei wurde durch 
Quantifizierung uber ein Agarose-Gel mit DNA-Marker VII und Auswertung 
dieses Gels im Lumi-lmager sichergestellt, dass gleiche Mengen an 
Template eingesetzt wurden. Die Expressionsansatze wurden uber einen 
Western-Blot ausgewertet. Die Ergebnisse sind in Figur 5 gezeigt. 

Die Expressionen lassen erkennen, dass ab einem Abstand von 9 Basen 
zum Start-ATG die Translation der mRNA moglich ist. Es besteht aber noch 
ein hemmender Einfluss des Hairpin-Loops. Erst ab einem Abstand von 12 
Basen verlauft die Translation wieder nahezu ungehemmt. Man kann also 
aus diesen Ergebnissen schlie&en, dass das Ribosom einen Platzbedarf von 
9-11 Basen nach dem Start-ATG besitzt. Des Weiteren lasst sich aus 
diesen Ergebnissen folgern, dass ein Hairpin-Loop, der 12 oder mehr Basen 
nach dem Start-ATG entfernt ist, zwar einen Einfluss auf die mRNA- 
Sekundarstruktur aber keinen auf die Initiation der Expression hat. 

Beispiel 5: Einfuhrung von Stem-Loop-Strukturen zur Auflosung 
ungiinstiger Sekundarstrukturen 

Bei fruheren Expressionsansatzen mit dem Rapid Translation System 
(Roche Applied Science) wurde bei einigen Genen nur eine geringe oder gar 
keine Expression gefunden. Als Ursache hierfur wurde oft eine ungiinstige 
RNA-Sekundarstruktur ermittelt, bei der entweder das Startcodon, oder die 
Shine-Dalgarno-Sequenz in einer Sekundarstruktur mit der Gensequenz 
involviert war, und damit in gebundener Form vorlag. 

Fur drei dieser Gene, Survivin, Cytomegalovirus Capsid Protein 1049 
(1049) und Class II Transactivator (CIITA) wurde eine heterologe 
Nukleinsauresequenz mit einem Hairpin-Loop und einer Stammlange von 7 
Basen in einem Abstand von 1 5 Basen nach dem Startcodon eingefuhrt. 
Direkt anschlieBend an den Hairpin Loop wurde das Wildtyp-Gen (siehe 
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unten *) ohne das Start ATG gesetzt. Vor den Hairpin- Loop wurden 
jeweils AT reiche Sequenzen gesetzt, welche weniger stabile 
Basenpaarungen als GC reiche Sequenzen ausbilden konnen. AuBerdem 
wurde darauf geachtet keine fur E. coli seltenen Codons innerhalb der 
eingefuhrten Sequenzen zu verwenden. 

Dadurch, dass nun einerseits ein stabiler idealer Hairpin-Loop vorgegeben 
wird und andererseits direkt nach dem Startcodon eine Sequenz folgt, 
welche nicht zu Sekundarstrukturbildung neigt, sollte unabhangig vom 
nachfolgenden Gen eine freie Zugangigke.t fur den Initiationskomplex mit 
der kleinen ribosomale Untereinheit an die Shine-Dalgarno-Sequenz und das 
Start-ATG ermoglicht werden. 

Es wurden jeweils 9 verschiedene AT-reiche Sequenzen vor den 
Hairpin-Loops eingesetzt und mit den Wildtyp-Genen* verglichen. Als 
Kontrollgen wurde das GFP cycle 3 Protein mit den gleichen Hairpin-Loops 
und AT-reichen Sequenzen iiber die in Beispiel 1 erwahnte Zweischrrtt-PCR 
synthetisiert. Die Sequenzen der A und B Primer sind unten angegeben. In 
Primer 1 wurden jeweils die homologen Bereiche zu Primer C unterstrichen. 
Die AT-reiche Sequenz wurde in kursiv, der Hairpin-Loop in Fettdruck und 
die Wildtyp Gensequenz in fett und unterstrichen angegeben. In Primer B 
wurden die zu Primer D homologen Bereiche unterstrichen und die Bereiche 
mit Homologie zum Wildtyp Gen fett angegeben. Als Primer D wurde 
abweichend zu Beispiel 1 der folgende Primer benutzt: 

Primer D (SEQ ID NO 16): 

CAAAAAACCCCTCAAGACCCGTTTAGAGGCCCCAAGGGGTTGGGAGTA 
GAATGTTA AGGATTAGTTTATTA 

Die unterstrichene Region ist homolog zu Primer C. 



Varianten Primer A: 

1049 - 1 iSEQ ID NO 17) - 
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AGGAGATATACCATGA44 TA TACA TA TTCTCTGCACGTGATCGTGCAG 
GCTAACACCGCG 

1049 - 2 (SEQ ID NO: 18): 

AGGAGATATACCATGAAAACATATTATTCTCTGCACGTGATCGTGCAG 
GCTAACACCGCG 

1049 - 3 (SEQ ID NO. 191: 

AGGAGATATACCATGAAATATTCTTATACACTGCACGTGATCGTGCAG 
GCTAACACCGCG 

1049 - 4 (SEQ ID NO. 20): 

AGGAGATATACCATGAAATATTATTCTACACTGCACGTGATCGTGCAG 
GCTAACACCGCG 

1049 - 5 (SEQ ID NO. 21): 

AGGAGATATACCATGAAATATACATATTCACTGCACGTGATCGTGCAG 
GCTAACACCGCG 

1049 - 6 (SEQ ID NO. 22): 

AGGAGATATACCATGAAAACATATTATTCACTGCACGTGATCGTGCAG 
GCTAACACCGCG 

1049 - 7 (SEQ ID NO. 23): 

AGGAGATATACCATGAAATATTCATATACACTGCACGTGATCGTGCAG 
GCTAACACCGCG 



1049 - 8 (SEQ ID NO. 24): 

AGGAGATATACCATGAAATATTATTCAACACTGCACGTGATCGTGCAG 
GCTAACACCGCG 
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1049 - 9 (SEQ IP NO. 25): 

AGGAGATATACCATGCATCATCATCATCATCTGCACGTGATCGTGCAG 
GCTAACACCGCG 

1049 - 10 (Wildtvp) (SEQ ID NO. 26): 
AGGAGATATACC ATGGCTAACACCGCG 

1049 - Primer B (SEQ ID NO. 27): 

AGGATTAGTTTATTA ATGATGATGATGATGATGGCGCCGnGTCtrRnfSA 
Unterstrichenes ist homoloq zu Primer D 



Varianten Primer A: 

Survivin - 1 (SEQ ID NO. 28): 

AGGAGATATACCATG>4/l/4 TA TACA TA 77"C7"CTGCACGTGATCGTGCAG 
GGTGCCCCGACG 

Survivin - 2 (SEQ ID NO. 29): 

AGGAGATATACCATGAAAACATATTATTCTCTGCACGTGATCGTGCAG 
GGTGCCCCGACG 

Survivin - 3 (SEQ ID NO. 30): 

AGGAGATATACCATGAAATATTCTTATACACTGCACGTGATCGTGCAG 
GGTGCCCCGACG 

Survivin - 4 (SEQ ID NO. 31): 

AGGAGATATACCATGAAATATTATTCTACACTGCACGTGATCGTGCAG 
GGTGCCCCGACG 

Survivin - 5 (SEQ ID NO. 32): 

AG GAG ATATACC ATG A A AT ATACATATTCACTG C ACGTG ATCGTG C AG 
GGTGCCCCGACG 
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Survivin - 6 (SEQ ID NO. 33): 

AGGAGATATACCATGAAAACATATTATTCACTGCACGTGATCGTGCAG 
GGTGCCCCGACG 

Survivin - 7 (SEQ ID NO. 34): 

AGGAGATATACCATGAAATATTCATATACACTGCACGTGATCGTGCAG 
GGTGCCCCGACG 

Survivin - 8 (SEQ ID NO. 35): 

AGGAGATATACCATGAAATATTATTCAACACTGCACGTGATCGTGCAG 
GGTGCCCCGACG 

Survivin - 9 (SEQ ID NO. 36): 

AGGAGATATACCATGCATCATCATCATCATCTGCACGTGATCGTGCAG 
GGTGCCCCGACG 

Survivin - 10 (A Wildt yp) (SEQ ID NO 37) - 
AGGAGATATA^HATfinraTrinr^q^Q 

Survivin - Primer B (SEQ ID NO. 3fi) - 

AGGATTAGTTTATTAATGATGATGATGATGATGATCCATGGCAGCCAGC 
CIITA - 1 (SEQ ID NO: 3ft): 

AGGAGATATACCATG/4A4 TA TACA TA 7TC7CTGCACGTGATCGTGCAG 
GAGTTGGGGCCC 

CIITA - 2 (SEQ ID NO. AO)- 

AGGAGATATACCATGAAAACATATTATTCTCTGCACGTGATCGTGCAG 
GAGTTGGGGCCC 
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CIITA - 3 fSEQ ID NO. 41): 

AGGAGATATACCATGAAATATTCTTATACACTGCACGTGATCGTGCAG 
GAGTTGGGGCCC 



CIITA - 4 (SEQ ID NO: 42: 

AGGAGATATACCATGAAATATTATTCTACACTGCACGTGATCGTGCAG 
GAGTTGGGGCCC 



CIITA - 5 (SEQ ID NO. 43): 

AGGAGATATACCATGAAATATACATATTCACTGCACGTGATCGTGCAG 
GAGTTGGGGCCC 



CIITA - 6 (SEQ ID NO. 44): 

AGGAGATATACCATGAAAACATATTATTCACTGCACGTGATCGTGCAG 
GAGTTGGGGCCC 

CIITA - 7 (SEQ ID NO. 45): 

AGGAGATATACCATGAAATATTCATATACACTGCACGTGATCGTGCAG 
GAGTTGGGGCCC 



CIITA - 8 (SEQ ID NO. 46): 

AGGAGATATACCATGAAATATTATTCAACACTGCACGTGATCGTGCAG 
GAGTTGGGGCCC 



CIITA - 9 SEQ ID NO. 47): 

AGGAGATATACCATGCATCATCATCATCATCTGCACGTGATCGTGCAG 
GAGTTGGGGCCC 



CIITA - 10 (A Wildtvp) (SEQ ID NO: 48): 
AGGAGATATACC ATGGAGTTGGGGCCC 
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CIITA Primer B (SEQ ID NO. 491: 

AGGATTAGTTTATTA TTAATGATnATnATnATPSATnAftAAnnrcc 

Im Folgenden sind die Sequenzen der uber PCR erzeugten 
Expressionskonstrukte fur die Mutante 1 und den Wildtyp angegeben. Die 
Wildtyp-Gensequenz ist fett angegeben. Am Ende des Gens wurde mit dem 
B-Primer jeweils ein hexa-Histidin-Tag zur Detektion mit einem spezifischen 
Antikorper eingefiihrt (unterstrichen). 

1049 - 1 (431 bo) (SEQ ID NO. 501: 

GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 

AAATAATTTTGTTTAACTTTAAGAAGGAGATATACCATGAAATATACAT 

ATTCTCTGCACGTGATCGTGCAGGCTAACACCGCGCCGGGACCCAGGG 

TGGCAAACAAGCGGGACGAAAAACACCGTCACGTCGTTAACGTCGTTT 

TCCAGCTGCCGACCGAGATATCAGAGGCCACCCACCCGGTGTTGGACA 

CCATGCTGAGCAAGTACACGCGCATGTCCAGCCTGTTTAATGACAAGT 

GCGCCTTTAAGCTGGACCTGTTGCGCATGGTAGCCGTGTCGCGCACCC 

GGCGC CATCATCATCATCATCAT TAATAAArTAATPnTTAArATTrTAn 

TCCCAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG 
1049 - 10 (WildTvp) (398 bo) (SEQ ID NO. 51): 

GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 

AAATAATTTTGTTTAACTTTAAGAAGGAGATATACCATGGCTAACACCG 

CGCCGGGACCCACGGTGGCCAACAAGCGGGACGAAAAACACCGTCAC 

GTCGTTAACGTCGTTTTGGAGCTGCCGACCGAGATATCAGAGGCCACC 

CACCCGGTGTTGGCCACCATGCTGAGCAAGTACACGCGCATGTCCAGC 

CTGTTTAATGACAAGTGCGCCTTTAAGCTGGACCTGTTGCGCATGGTAG 

CCGTGTCGCGCACCCGGCGC CATCATCATCATCATCAT TAATAAAr.TA 

ATCCTTAACATTCTACTCCCAACCCCTTGGGGCCTCTAAACGGGTCTTG 
AGGGGTTTTTTG 
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Survivin - 1 (632 bp) (SEP. ID NO. 52): 

GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 

AAATAATTTTGTTTAACTTTAAGAAGGAGATATACCATGAAATATACAT 

ATTCTCTGCACGTGATCGTGCAGGGTGCCCCGACGTTGCCCCCTGCCTG 

GCAGCCCTTTCTCAAGGACCACCGCATCTCTACATTCAAGAACTGGCC 

CTTCTTGGAGGGCTGCGCCTGCACCCCGGAGCGGATGGCCGAGGCTGG 

CTTCATCCACTGCCCCACTGAGAACGAGCCAGACTTGGCCCAGTGTTT 

CTTCTGCTTCAAGGAGCTGGAAGGCTGGGAGCCAGATGACGACCCCAT 

AGAGGAACATAAAAAGCATTCGTCCGGTTGCGCTTTCCTTTCTGTCAAG 

AAGCAGTTTGAAGAATTAACCCTTGGTGAATTTTTGAAACTGGACAGA 

GAAAGAGCCAAGAACAAAATTGCAAAGGAAACCAACAATAAGAAGAA 

AGAATTTGAGGAAACTGCGAAGAAAGTGCGCCGTGCCATCGAGCAGCT 

GGCTGCCATGGATCATCATCATnATnATrATTAATAAAnT/y^T^o-n-^^ 

CATTCTACTCCCAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTT 
TTTG 

Survivin - 10 (Wildtv pl (599 bpj (SEQ ID MO. 531- 

GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 

AAATAATTTTGTTTAACTTTAAGAAGGAGATATACCATGGGTGCCCCGA 

CGTTGCCCCCTGCCTGGCAGCCCTTTCTCAAGGACCACCGCATCTCTAC 

ATTCAAGAACTGGCCCTTCTTGGAGGGCTGCGCCTGCACCCCGGAGCG 

GATGGCCGAGGCTGGCTTCATCCACTGCCCCACTGAGAACGAGCCAGA 

CTTGGCCCAGTGTTTCTTCTGCTTCAAGGAGCTGGAAGGCTGGGAGCC 

AGATGACGACCCCATAGAGGAACATAAAAAGCATTCGTCCGGTTGCGC 

TTTCCTTTCTGTCAAGAAGCAGTTTGAAGAATTAACCCTTGGTGAATTT 

TTGAAACTGGACAGAGAAAGAGCCAAGAACAAAATTGCAAAGGAAAC 

CAACAATAAGAAGAAAGAATTTGAGGAAACTGCGAAGAAAGTGCGCC 

GTGCCATCGAGCAGCTGGCTGCCATGGA TCATCATCATCATrATnAT TA 

ATAAACTAATCCTTAACATTCTACTCCCAACCCCTTGGGGCCTCTAAAC 
GGGTCTTGAGGGGTTTTTTG 
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CIITA - 1 (14QO hp ) (SEQ in MO ra|. 

GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 

AAATAATTTTGTTTAACTTTAAGAAGGAGATATACCATGAAATATACAT 

ATTCTCTGCACGTGATCGTGCAGGAGTTGGGGCCCCTAGAAGGTGGCT 

ACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTT 

CTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTC 

AGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTT 

GTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATAT 

CGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCT 

GAGCAAGGACATTTTCAAGCACATAGGACCAGATGAAGTGATCGGTGA 

G AGTATG G AG ATG CC AG C AG A AGTTG GG C AG AA A AGTC AG AA AAG AC 

CCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGCTG 

AGCCCCCCACTGTGGTGACTGGCAGTCTCCTAGTGGGACCAGTGAGCG 

ACTGCTCCACCCTGCCCTGCCTGCCACTGCCTGCGCTGTTCAACCAGG 

AGCCAGCCTCCGGCCAGATGCGCCTGGAGAAAACCGACCAGATTCCC 

ATGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGAC 

CCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCA 

AATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGT 

GAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTC 

CACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTC 

GCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACC 

TCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCC 

GGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGT 

GGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGC 

AGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCT 

GGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGG 

ACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTG 

TTGGCTGCCAAGGAGCACCGGCGGCCGCGTCGACTCGAGCGAGCTCCC 
GGGGGGGGTTCTCATCATCATrATrATr atta ata ^ ^ ACT/> ^ TCCTT 

AACATTCTACTCCCAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGG 
TTTTTTG 
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CHTA -10 WT 1367 bp (SEQ ID NO. 55): 

GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 

AAATAATTTTGTTTAACTTTAAG AAGGAGATATACnA TfifiAftTTra^on^ 

CCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCC 

TGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAG 

AGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACC 

AGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGG 

AGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACT 

CCCAGCTGGAGGGCCTGAGCAAGGACATTTTCAAGCACATAGGACCAG 

ATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAG 

AAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAA 

GCACTGGAAGCCAGCTGAGCCCCCCACTGTGGTGACTGGCAGTCTCCT 

AGTGGGACCAGTGAGCGACTGCTCCACCCTGCCCTGCCTGCCACTGCC 

TGCGCTGTTCAACCAGGAGCCAGCCTCCGGCCAGATGCGCCTGGAGAA 

AACCGACCAGATTCCCATGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTG 

AATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGC 

CCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTA 

TATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTC 

CCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAG 

GCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGC 

CTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGT 

CCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAA 

AATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGT 

ATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATC 

TGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGG 

GAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGG 

CCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTCG 

ACTCGAGCGAGCTCCCGGGGGGGGTTC TCATCATCATCATCATHATT A 

ATAATAAACTAATCCTTAACATTCTACTCCCAACCCCTTGGGGCCTCTA 
AACGGGTCTTGAGGGGTTTTTTG 
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GFP CvC3 - 1 (938 bp) (SEQ ID NO. 56): 

GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 

AAATAATTTTGTTTAACTTTAAGAAGGAGATATACCATGAAATATACAT 

ATTCTCTGCACGTGATCGTGCAGACTAGCAAAGGAGAAGAACTTTTCA 

CTGGAGTTGTCCCAATTCTTGTTGAATTAGATGGTGATGTTAATGGGCA 

CAAATTTTCTGTCAGTGGAGAGGGTGAAGGTGATGCTACATACGGAAA 

GCTTACCCTTAAATTTATTTGCACTACTGGAAAACTACCTGTTCCATGG 

CCAACACTTGTCACTACTTTCTCTTATGGTGTTCAATGCTTTTCCCGTTA 

TCCGGATCATATGAAACGGCATGACTTTTTCAAGAGTGCCATGCCCGA 

AGGTTATGTACAGGAACGCACTATATCTTTCAAAGATGACGGGAACTA 

CAAGACGCGTGCTGAAGTCAAGTTTGAAGGTGATACCCTTGTTAATCG 

TATCGAGTTAAAAGGTATTGATTTTAAAGAAGATGGAAACATTCTCGG 

ACACAAACTCGAGTACAACTATAACTCACACAATGTATACATCACGGC 

AGACAAACAAAAGAATGGAATCAAAGCTAACTTCAAAATTCGCCACA 

ACATTGAAGATGGATCCGTTCAACTAGCAGACCATTATCAACAAAATA 

CTCCAATTGGCGATGGCCCTGTCCTTTTACCAGACAACCATTACCTGTC 

GACACAATCTGCCCTTTCGAAAGATCCCAACGAAAAGAGAGACCACAT 

GGTCCTTCTTGAGTTTGTAACAGCTGCTGGGATTACACATGGCATGGAT 

GAACTATACAAACCCGGGGGGGGTTC TCATCATCATCATCATCAT TAA 

TAAACTAATCCTTAACATTCTACTCCCAACCCCTTGGGGCCTCTAAACG 
GGTCTTGAGGGGTTTTTTG 

plVEX-GFP CvC3 - 10 905 bp (SEQ ID MO. 57): 

GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 

AAATAATTTTGTTTAACTTTAAGAAGGAGATATACCATGACTAGCAAA 

GGAGAAGAACTTTTCACTGGAGTTGTCCCAATTCTTGTTGAATTAGATG 

GTGATGTTAATGGGCACAAATTTTCTGTCAGTGGAGAGGGTGAAGGTG 

ATGCTACATACGGAAAGCTTACCCTTAAATTTATTTGCACTACTGGAAA 

ACTACCTGTTCCATGGCCAACACTTGTCACTACTTTCTCTTATGGTGTTC 

AATGCTTTTCCCGTTATCCGGATCATATGAAACGGCATGACTTTTTCAA 

GAGTGCCATGCCCGAAGGTTATGTACAGGAACGCACTATATCTTTCAA 

AGATGACGGGAACTACAAGACGCGTGCTGAAGTCAAGTTTGAAGGTGA 
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TACCCTTGTTAATCGTATCGAGTTAAAAGGTATTGATTTTAAAGAAGAT 

GGAAACATTCTCGGACACAAACTCGAGTACAACTATAACTCACACAAT 

GTATACATCACGGCAGACAAACAAAAGAATGGAATCAAAGCTAACTTC 

AAAATTCGCCACAACATTGAAGATGGATCCGTTCAACTAGCAGACCAT 

TATCAACAAAATACTCCAATTGGCGATGGCCCTGTCCTTTTACCAGACA 

ACCATTACCTGTCGACACAATCTGCCCTTTCGAAAGATCCCAACGAAA 

AGAGAGACCACATGGTCCTTCTTGAGTTTGTAACAGCTGCTGGGATTAC 

ACATGGCATGGATGAACTATACAAACCCGGGGGGGGTTC TCATCATCA 

ICAICAICAITAATAAACTAATCCTTAACATTCTACTCCCAACCCCTTG 

GGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG 

Man kann an den in den Figuren 6 bis 9 gezeigten Expressionen erkennen, 
dass die mit den Stem-Loop-Strukturen synthetisierten DNA Templates in 
alien Fallen zu einer Proteinsynthese fuhrten, wahrend beim Wildtypgen 
keine Proteinsynthese stattfand. Die Mutante 9 mit der Hexa-Histidin 
Sequenz wird dabei etwas schlechter als die ubrigen AT-reichen Sequenzen 
exprimiert, hat aber den Vorteil, dass man das entstehende Protein uber 
diese Markierung mit sechs Histidinresten an Ni-NTA-Chelat Saulen 
aufreinigen kann. Auch im Falle des GFP-Gens, einem ohnehin gut 
exprimierten Gen f fuhrten die Stem-Loop-Konstrukte zu einer 
Ausbeutesteigerung. 

Beispiel 6: Entfernen der Stem-Loop-Struktur zum Nachweis der Funktion 

Um die Wirkung der Stem-Loop-Struktur von der Wirkung der eingefuhrten 
AT-reichen Sequenz zu unterscheiden wurden von je zwei der Mutanten 
eine identische PCR jedoch ohne den Teil des Stem-Loops hergestellt und 
im direkten Vergleich mit den Stem-Loop-Mutanten exprimiert. 

An diesen Beispielen lasst sich deutlich der Einfluss der Stem-Loop-Struktur 
ersehen. Wahrend beim GFP die AT-reiche Sequenz alleine zu einer 
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gesteigerten Expression fuhrt, bringt die Stem-Loop-Sequenz bei den 
schwer exprimierbaren Genen den entscheidenden Beitrag. 

Beispiel 7: Modification der Stem-Loop-Struktur zur Ermittlung der fur die 
Funktion wichtigen Eigenschaften 

Urn die Wirkung der GC-Basen innerhalb der Stem-Loop-Struktur zu 
ermitteln, wurde deren Sequenz durch eine AT-reiche Sequenz mit der 
gleichen freien Energie wie der des GC-reichen Stem-Loops ersetzt. 

Fur die Beispiele Survivin, CIITA und 1049 wurden dafur statt der 
urspriinglichen Stem-Loop-Sequenz CTG.CAC.GTG.ATC.GTG.CAG mit (G 
= -9,8 kcal/mol und einer Stammlange von 7 Basenpaaren ein neuer Stem- 
Loop (Loop') mit der Sequenz CAG.ACA.AAT.AGA.TAT.TTG.TCT.GTA mit 
(G = -9,8 kcal/mol und einer Stammlange von 9 Basenpaaren mit der AT- 
reichen Sequenz von Mutante 1 kombiniert. Die beiden Strukturen sind in 
Figur 12 gezeigt. 

Man kann erkennen, dass beide Stem-Loop-Varianten die Expression 
gegenuber den jeweiligen Wildtypgenen deutlich steigern oder erst 
ermoglichen. Die GC-reichen Stem-Loop-Varianten weisen dabei eine etwas 
deutlichere Expressionssteigerung auf. 

Beispiel 8: in vivo Protein Expression 

Die PCR-Produkte aus Beispiel 5 mit dem Expressionskonstrukt fur das 
Wildtypgen des Cytomegalovirus Capsid Protein 1049 sowie fur das 
Survivin Wildtypgen wurden inpBAD-TOPO (Invitrogen, Carlsbad, USA) 
Vektoren kloniert. Ebenso wurden jeweils die Expressionskonstrukte fur 
Mutanten des Gens fur das Cytomegalovirus Capsid Protein 1 049 und das 
Survivin Gen in diesen Vektor kloniert. Danach wurden die Plasmide in B21 
pLyS (Stratagene, Amsterdam, Netherlands) Stamme transformiert und auf 
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auf LB Platten mit 100jt/g/ml Carbenicillin und 34 jjg/ml Chloramphenicol 
ausgestrichen. Die Inserts wurden durch Sequenzierung Ciberpruft. Fur die 
in vivo Protein Expression wurden je 3 Kolonien isoliert und in 4 ml Medium 
bei 37 °C fur 5 h angezogen. Bei Erreichen einer Zelldichte von 10 8 
Zellen/ml, wurde die Expression durch Zugabe von 1 mM IPTG induziert und 
weitere 2 h inkubiert. Je 1 ml Zellsuspension davon wurde abzentrifugiert 
(3 min 14000 rpm) und der Niederschlag in SDS Probenpuffer fur 20 min 
bei 95 °C 1400 rpm auf einem Thermoschuttler erhitzt. Je 10 //I davon 
wurden auf ein SDS Gel aufgetragen und mit einem Western Blot wie in 
Beispiel 5 analysiert. 



Die Expressionen in Figur 1 4 zeigen, dass die Stem-Loop-Konstrukte fur die 
beiden untersuchten Gene Cytomegalovirus Capsid Protein 1049 sowie 
Survivin auch in vivo eine wesentliche hohere Expression als die 
Wildtypgene aufweisen. Dies beweist, dass sich die Ergebnisse der in vitro 
Expression auf die in vivo Expression ubertragen lassen. 



WO 2004/053053 ^ ^:T/EP2003/0 13964 

- 32 - 



Anspruche 



Verfahren zur Herstellung eines Proteins, umfassend die Schritte: 

(a) Bereitstellen einer fur das Protein kodierenden 

Nukleinsauresequenz, wobei 3'-seitig des Translations- 

Startcodons eine heterologe Nukleinsauresequenz im 

korrekten Leseraster eingefugt wird, die so gewahlt wird, 

dass in einem Abstand von 6-30 Nukleotiden 3'-seitig des 

Translations-StartcodonseineStem-Loop-Strukturausgebildet 
wird, 

(b) Bereitstellen eines zur Expression des Proteins geeigneten 
Expressionssystems und 

(c) Einbringen der Nukleinsauresequenz gemaB (a) in das 
Expressionssystem gemaB (b) unter Bedingungen, dass das 
Protein synthetisiert wird. 



2. Verfahren nach Anspruch 1 , weiterhin umfassend das Gewinnen des 
Proteins. 



3. Verfahren nach Anspruch 1 oder 2, 
dadurch gekennzeichnet, 

dass die eingefugte heterologe Nukleinsauresequenz eine Lange bis 
zu 201 Nukleotiden aufweist. 



4. Verfahren nach Anspruch 3, 
dadurch gekennzeichnet, 

dass die eingefugte heterologe Nukleinsauresequenz eine Lange bis 
zu 45 Nukleotiden aufweist. 
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5. Verfahren nach einem der Anspruche 1 bis 4, 
dadurch gekennzeichnet, 

dass die Stem-Loop-Struktur in einem Abstand von 12-21 
Nukleotiden 3'-seitig des Startcodons ausgebildet wird. 

6. Verfahren nach einem der Anspruche 1 bis 5, 
dadurch gekennzeichnet, 

dass die Lange des Stem in der Stem-Loop-Struktur im Bereich von 
4-12 Nukleotiden ist. 

7. Verfahren nach einem der Anspruche 1 bis 6, 
dadurch gekennzeichnet, 

dass der Bereich der heterologen Nukleinsauresequenz, der 5'-seitig 
der Stem-Loop-Struktur liegt, selbst keine Sekundarstruktur ausbildet 
und keine Sekundarstruktur mit der 5'-untranslatierten Region der fur 
das herzustellende Protein kodierenden Nukleinsauresequenz 
eingehen kann. 

8. Verfahren nach einem der Anspruche 1 bis 7, 
dadurch gekennzeichnet, 

dass der Bereich der heterologen Nukleinsauresequenz, der 5'-seitig 
der Stem-Loop-Struktur und 3'-seitig des ATG-Startcodons liegt, 
einen GC-Gehalt von <50 % aufweist. 

9. Verfahren nach einem der Anspruche 1 bis 8, 
dadurch gekennzeichnet, 

dass man ein in vitro Expressionssystem verwendet. 

10. Verfahren nach Anspruch 9, 
dadurch gekennzeichnet, 

dass man ein prokaryontisches in vitro Expressionssystem 
verwendet. 
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1 1 . Verfahren nach Anspruch 10, 
dadurch gekennzeichnet, 

dass das prokaryontische in vitro Expressionssystem Lysate von 
gram-negativen Bakterien, insbesondere von Escherichia coli, oder 
gram-positiven Bakterien, insbesondere Bacillus subtilis, enthalten. 



12. Verfahren nach Anspruch 9, 
dadurch gekennzeichnet, 

dass man ein eukaryontisches in vitro Expressionssystem 
verwendet. 



13. Verfahren nach Anspruch 12, 
dadurch gekennzeichnet, 

dass das eukaryontische in vitro Expressionssystem Lysate von 
Saugerzellen, insbesondere von Kaninchen, Reticulocytes humanen 
Tumorzelllinien, Hamsterzelllinien, oder anderen Wirbeltierzellen, 
insbesondere Oozyten und Eiern von Fischen und Amphibien, sowie 
Insektenzelllinien, Hefezellen, Algenzellen oder Extrakte aus 
Pflanzenkeimen enthalt. 

14. Verfahren nach einem der Anspruche 1 bis 8, 
dadurch gekennzeichnet, 

dass man ein prokaryontisches in vivo Expressionssystem 
verwendet. 



1 5. Verfahren nach Anspruch 1 4, 
dadurch gekennzeichnet, 

dass man eine prokaryontische Wirtszelle als Expressionssystem 
verwendet. 
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16. Verfahren nach Anspruch 15, 
dadurch gekennzeichnet, 

dass man eine gram-negative prokaryontische Wirtszelle, 
insbesondere eine E.coli Zelle, oder eine gram-positive 
prokaryontische Wirtszelle, insbesondere eine Bacillus subtilis Zelle, 
verwendet. 

17. Verfahren nach Anspruch 14, 
dadurch gekennzeichnet, 

dass man eine eukaryontische Wirtszelle als Expressionssystem 
verwendet. 

18. Verfahren nach Anspruch 17, 
dadurch gekennzeichnet, 

dass man eine Hefezelle, eine Insektenzelle oder eine Wirbeltierzelle, 
insbesondere eine Amphibien-, Fische-, Vogel- oder Saugerzelle, 
verwendet. 

19. Verfahren nach Anspruch 14, 
dadurch gekennzeichnet, 

dass man einen nicht-humanen eukaryontischen Wirtsorganismus als 
Expressionssystem verwendet. 

20. Verfahren nach einem der Anspruche 1 bis 1 9, 
dadurch gekennzeichnet, 

dass das Bereitstellen der fur das Protein kodierenden 
Nukleinsauresequenz durch Klonierung, Rekombination oder/und 
Amplifikation erfolgt. 

21 . Verfahren nach Anspruch 20, 
dadurch gekennzeichnet, 

dass das Bereitstellen eine Zweistufen-PCR umfasst. 



WO 2004/053053 




T/EP2003/013964 



22. Verfahren nach einem der Anspriiche 1 bis 21, 
dadurch gekennzeichnet, 

dass die fur das herzustellende Protein kodierende 
Nukleinsauresequenz oder/und die heterologe Nukleinsauresequenz 
zumindest teilweise eine an das jeweiligen Expressionssystem 
angepasste Codon-Nutzung aufweisen. 



23. Verfahren nach einem der Anspruche 1 bis 22, 
dadurch gekennzeichnet, 

dass die heterologe Nukleinsauresequenz einen fiir eine 
Aufreinigungsdomane oder/und einen fur eine Proteinase- 
Erkennungsdomane kodierenden Abschnitt enthalt. 

24. Reagenz zur Herstellung eines Proteins, umfassend 

(a) eine zu der fur das Protein kodierenden Nukleinsauresequenz 
heterologe Nukleinsauresequenz, die im korrekten Leseraster 
in die Protein-kodierende Nukleinsauresequenz eingefugt 
werden kann, und die in einem Abstand von 6-30 Nukleotiden 
3'-seitig des Translations-Startcodons eine Stem-Loop- 
Struktur ausbilden kann, und 

(b) ein zur Herstellung des Proteins geeignetes 
Expressionssystem. 
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Figur2 



HL mit Stammlange 6bp: -7,8 kcal/mol 

A 
A U 
C U 
U-A 
G-C 
G-C 
U-A 
C-G 
A-U 



5'- AGGAGAUAUACCAUG ACUAGCAAAGGAGAA.. -3' 



HL mit Stammlange 7bp: -8,6 kcal/mol 

CA 
A U 
U C 
U-A 
U-A 
C-G 
G-C 
U-A 
C-G 
A-U 



5 - AGGAGAUAUACCAUG ACUAGCAAAGGAGAA... -3' 
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Figur 2 (Fortsetzung) 



HL mit Stammlange 4bp: -4,1 kcal/mol 

UU 
A U 
A-U 
U-A 
C-G 
A-U 

5'- AGGAGAUAUACCAUG ACUAGCAAAGGAGAA... 



HL mit Stammlange 5bp: -4,4 kcal/mol 

UA 
U U 
U-A 
G-C 
U-A 
C-G 
A-U 



5'- AGGAGAUAUACCAUG ACUAGCAAAGGAGAA... -: 



HL mit Stammlange 8bp: kcal/mol 

U. U 
G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 



5'- AGGAGAUAUACCAUG ACUAGCAAAGGAGAA... -3 




Stammiange des Loops 
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Figur4 

HL mit Stammlange 8bp. 6 Basen nach Start-ATG: 

GA 
U U 
G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 



. 5'- AGGAGAUAUACCAUGACUAGC AAAGGAGAA.. -3' 



HL mit Stammlange 8bp, 9 Basen nach Start-ATG: 



GA 
U U 
G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 



5'- AGGAGAUAUACCAUGACUAGCA£A. GGAGAA.. -3' 



HL mit Stammlange 8bp, 12 Basen nach Start -ftTig,': 

G/V 

C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 
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5 " AGGAGAUAUACCAUGACUAGCAAAGGA GAA... -3' 



GA 
U U 
G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 



5 - AGGAGAUAUACCAUGACUAGCAA A GGAGAA... -3' 



HL mit Stammlange 8bp, 12 Basen nach Start - ArTTS: 

G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 



5'- AGGAGAUAUACCAUGACUAGCAAAGGA GAA... -3' 
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Figur 4 (Fortsetzung) 



HL mit Stammlange 8bp, 15 Basen nach Start-ATG: 

GA 
U U 
G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 



5'- — AGGAGAUAUACCAUGACUAGCAAAGGAGAA GAA.. -3' 



- HL mit Stammlange 8bp, 18 Basen nach Start-ATG: G * 

U U 
G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 



5- AGGAGAUAUACCAUGACUAGCAAAGGAGAAGAA CTT... -3' 



HL mit Stammlange 8bp, 21 Basen nach Start-ATG- 

GA 
U U 
G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 

5 '" AGGAGAUAUACCAUGACUAGCAAAGGAGAAGAACTT TTC... -3' 



wo 



Figur5 




Abstand des Loops vom Start ATG 
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Figur 6 



Spur 1-9= Mutante 9-1 Spur 1 entspricht der Wildtypsequenz 




WO 2004/053053 




T/EP2003/013964 



10/16 



Figur7 



GFP/1049 

Spur 1,2= Mutante 1,2 GFP ohne Loop. Spur 3,4= Mutante 1,2 GFP mit Loop. 
Spur 5 entspricht der GFP WUdtypsequenz. Spur 6,7= Mutante 1,2 1049 
ohne Loop. Spur 8,9= Mutante 1,2 1049 mit Loop. Spur 10 entspricht der 
1049 WUdtypsequenz. 
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Figur 8 



Survivin 

Spur 1-9= Mutante 1-9 Spur 10 entspricht der Wildtypsequenz 
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Figur9 



GFP 

Spur 1-9= Mutante 1-9 Spur 10 entspricht der Wildtypseqi 
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Figur 10 



GFP/1049 

Spur 1,2= Mutante 1,2 GFP ohne Loop. Spur 3,4= Mutante 1,2 GFP mit Loop. 
Spur 5 entspricht der GFP Wfldtypsequenz. Spur 6,7= Mutante 1,2 1049 
ohne Loop. Spur 8,9= Mutante 1,2 1049 mit Loop. Spur 10 entspricht der 
1049 Wildtypsequenz. 
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Figurll 



CIITA/Survivin 

Spur 1 entspricht d^- CIITA WUdtypsequenz.Spur 2,3= Mutante 1,2 CHTA mit 

Mutante c 1 ' 2 CIITA ohne Loop. Spur 6 entepricht der 

'rMZsr^ 1,2 ~ ■* ^ *- 
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Figur 12 
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Figur 13 

1049/Survivin/CIITA Loop und Loop'-Varianten 

Spur 1 1049 Mutante 1 Loop, Spur 2 Mutante 1 Loop Spur 3 eirtspricht der 
1049 Wildtypsequenz; Spur 4 Survivin Mutante 1 Loop, Spur 5 Mutante 1 
Loop ', Spur 6 entspricht der Survivin Wildtypsequenz; Spur 7 CHTA 
Mutante 1 Loop, Spur 8 Mutante 1 Loop ', Spur 9 entspricht der CHTA 
Wildtypsequenz 




Figur 14 
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SEQUENCE LISTING 
<110> Roche Diagnostics GmbH 
<120> Optimierte Proteinsynthese 
<130> 29415pwo 

<140> PCT/EP03 
<141> 2003-12-09 

<160> 57 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 84 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer C 
<400> 1 

gaaattaata cgactcacta tagggagacc acaacggttt ccctctagaa ataattttgt 60 
ttaactttaa gaaggagata tacc fi4 



<210> 2 
<211> 71 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer D 
<400> 2 

caaaaaaccc ctcaagaccc gtttagaggc cccaaggggg gccgccagtg tgctgaattc 60 
gccttttatt a 



<210> 3 
<211> 30 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
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without hairpinloop 



<400> 3 



aggagatata ccatgactag caaaggagaa 



30 



<210> 4 
<211> 42 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
Stammlange 4 bp 

<400> 4 

aggagatata ccatgactaa ttttagtact agcaaaggag aa 4 2 

<210> 5 
<211> 45 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
Stammlange 5 bp 



<210> 6 
<211> 48 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
Stammiange 6 bp 

<400> 6 

aggagatata ccatgactgg tcaattacca gtaactagca aaggagaa 4 8 



<400> 



5 



aggagatata ccatgactgt ttatacagta actagcaaag gagaa 



45 



<210> 7 
<211> 51 
<212> DNA 
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<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
Stammlange 7 bp 

<400> 7 

aggagatata ccatgactgc tttacatcaa gcagtaacta gcaaaggaga a 51 



<210> 8 
<211> 51 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
Stammlange 8 bp 

<400> 8 

aggagatata ccatgactgc acgtgatcgt gcagtaacta gcaaaggaga a 51 



<210> 9 
<211> 30 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer B 
<400> 9 

attcgccttt tattaatgat gatgatgatg 30 



<210> 10 
<211> 60 
<212> DNA 

<213> Artificial Sequence 



<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 10 

aggagatata ccatgactag cactgcacgt gcatcgtgca gtgtaaaagg agaagaactt 60 



<210> 11 
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<211> 63 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 11 

aggagatata ccatgactag caaaactgca cgtgcatcgt gcagtgtagg agaagaactt 60 
ttc 63 



<210> 12 
<211> 66 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 12 

aggagatata ccatgactag caaaggaact gcacgtgcat cgtgcagtgt agaagaactt 60 
ttcact 66 



<2l6> 13 
<211> 69 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 13 

aggagatata ccatgactag caaaggagaa actgcacgtg catcgtgcag tgtagaactt 60 
ttcactgga 69 



<210> 14 
<211> 72 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 



<400> 14 

aggagatata ccatgactag caaaggagaa gaaactgcac gtgcatcgtg cagtgtactt 60 
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ttcactggag tt 



72 



<210> 15 
<211> 75 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 15 

aggagatata ccatgactag caaaggagaa gaacttactg cacgtgcatc gtgcagtgta 60 
ttcactggag ttgtc 75 

<210> 16 
<211> 71 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer D 
<400> 16 

caaaaaaccc ctcaagaccc gtttagaggc cccaaggggt tgggagtaga atgttaagga 60 
ttagtttatt a 71 

<210> 17 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 17 

aggagatata ccatgaaata tacatattct ctgcacgtga tcgtgcaggc taacaccgcg 60 

<210> 18 
<211> 60 
<212> DNA 

<213> Artificial Sequence 



<220> 

<223> Description of Artificial Sequence : Primer A 
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<400> 18 

aggagatata ccatgaaaac atattattct ctgcacgtga tcgtgcaggc taacaccgcg 60 

<210> 19 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 19 

aggagatata ccatgaaata ttcttataca ctgcacgtga tcgtgcaggc taacaccgcg 60 

<210> 20 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 20 

aggagatata ccatgaaata ttattctaca ctgcacgtga tcgtgcaggc taacaccgcg 60 

<210> 21 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 21 

aggagatata ccatgaaata tacatattca ctgcacgtga tcgtgcaggc taacaccgcg 60 

<210> 22 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
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<400> 22 

aggagatata ccatgaaaac atattattca ctgcacgtga tcgtgcaggc taacaccgcg 60 

<210> 23 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 23 

aggagatata ccatgaaata ttcatataca ctgcacgtga tcgtgcaggc taacaccgcg 60 

<210> 24 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 24 

aggagatata ccatgaaata ttattcaaca ctgcacgtga tcgtgcaggc taacaccgcg 60 

<210> 25 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 25 

aggagatata ccatgcatca tcatcatcat ctgcacgtga tcgtgcaggc taacaccgcg 60 

<210> 26 
<211> 27 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer Wildtyp 
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<400> 26 



aggagatata ccatggctaa caccgcg 



27 



<210> 27 
<211> 48 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer B 
<400> 27 

aggattagtt tattaatgat gatgatgatg atggcgccgg gtgcgcga 48 

<210> 28 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 28 

aggagatata ccatgaaata tacatattct ctgcacgtga tcgtgcaggg tgccccgacg 60 

<210> 29 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 29 

aggagatata ccatgaaaac atattattct ctgcacgtga tcgtgcaggg tgccccgacg 60 

<210> 30 
<211> 60 
<212> DNA 

<213> Artificial Sequence 



<220> 

<223> Description of Artificial Sequence : Primer A 
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<400> 30 

aggagatata ccatgaaata ttcttataca ctgcacgtga tcgtgcaggg tgccccgacg 60 

<210> 31 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 31 

aggagatata ccatgaaata ttattctaca ctgcacgtga tcgtgcaggg tgccccgacg 60 

<210> 32 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 32 

aggagatata ccatgaaata tacatattca ctgcacgtga tcgtgcaggg tgccccgacg 60 

<210> 33 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 33 

aggagatata ccatgaaaac atattattca ctgcacgtga tcgtgcaggg tgccccgacg 60 

<210> 34 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 

9 
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<400> 34 

aggagatata ccatgaaata ttcatataca ctgcacgtga tcgtgcaggg tgccccgacg 60 

<210> 35 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 35 

aggagatata ccatgaaata ttattcaaca ctgcacgtga tcgtgcaggg tgccccgacg 60 

<210> 36 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
<400> 36 

aggagatata ccatgcatca tcatcatcat ctgcacgtga tcgtgcaggg tgccccgacg 60 

<210> 37 
<211> 27 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
Wildtyp 



<210> 38 
<211> 49 
<212> DNA 

<213> Artificial Sequence 
<220> 



<400> 



37 



aggagatata ccatgggtgc cccgacg 



27 



10 
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<223> Description of Artificial Sequence : Primer B 



<400> 38 



aggattagtt tattaatgat gatgatgatg atgatccatg gcagccagc 



49 



<210> 39 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer 
<400> 39 

aggagatata ccatgaaata tacatattct ctgcacgtga tcgtgcagga gttggggccc 60 

<210> 40 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer 
<400> 40 

aggagatata ccatgaaaac atattattct ctgcacgtga tcgtgcagga gttggggccc 60 

<210> 41 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer 
<40d> 41 

aggagatata ccatgaaata ttcttataca ctgcacgtga tcgtgcagga gttggggccc 60 

<210> 42 
<211> 60 
<212> DNA 

<213> Artificial Sequence 



<220> 
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<223> Description of Artificial Sequence : Primer 
<400> 42 

aggagatata ccatgaaata ttattctaca ctgcacgtga tcgtgcagga gttggggccc 60 

<210> 43 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer 
<400> 43 

aggagatata ccatgaaata tacatattca ctgcacgtga tcgtgcagga gttggggccc 60 

* 

<210> 44 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer 
<400> 44 

aggagatata ccatgaaaac atattattca ctgcacgtga tcgtgcagga gttggggccc 60 

<210> 45 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer 
<400> 45 

aggagatata ccatgaaata ttcatataca ctgcacgtga tcgtgcagga gttggggccc 60 

<210> 46 
<211> 60 
<212> DNA 

<213> Artificial Sequence 
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<220> 
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<223> Description of Artificial Sequence : Primer 
<400> 46 

aggagatata ccatgaaata ttattcaaca ctgcacgtga tcgtgcagga gttggggccc 60 



<210> 47 
<211> 60 
<212> DNA 

<213> Artificial Sequence 



<220> 

<223> Description of Artificial Sequence : Primer 
<400> 47 

aggagatata ccatgcatca tcatcatcat ctgcacgtga tcgtgcagga gttggggccc 60 



<210> 48 
<211> 27 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence : Primer A 
Wildtyp 

<400> 48 

aggagatata ccatggagtt ggggccc 27 



<210:> 49 

<211> 45 

<212> DNA 

<213> Artificial 



Sequence 



<220> 

<223> Description of Artificial Sequence : Primer B 
<400> 49 

aggattagtt tattattaat gatgatgatg atgatgagaa ccccc 45 



<210> 50 
<211> 431 
<212> DNA 

<213> Artificial Sequence 
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<220> 

<223> Description of Artificial Sequence: 
Expressionskonstrukt fur Mutante 1 

<400> 50 

gaaattaata cgactcacta tagggagacc acaacggttt ccctctagaa ataattttgt 60 

ttaactttaa gaaggagata taccatgaaa tatacatatt ctctgcacgt gatcgtgcag 120 

gctaacaccg cgccgggacc cacggtggcc aacaagcggg acgaaaaaca ccgtcacgtc 180 

gttaacgtcg ttttggagct gccgaccgag atatcagagg ccacccaccc ggtgttggcc 240 

accatgctga gcaagtacac gcgcatgtcc agcctgttta atgacaagtg cgcctttaag 300 

ctggacctgt tgcgcatggt agccgtgtcg cgcacccggc gccatcatca tcatcatcat 360 

taataaacta atccttaaca ttctactccc aaccccttgg ggcctctaaa cgggtcttga 420 
ggggtttttt g 431 



<210> 51 
<211> 398 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence: 
Expressionskonstrukt fUr Wildtyp 

<400> 51 

gaaattaata cgactcacta tagggagacc acaacggttt ccctctagaa ataattttgt 60 
ttaactttaa gaaggagata taccatggct aacaccgcgc cgggacccac ggtggccaac 120 
aagcgggacg aaaaacaccg tcacgtcgtt aacgtcgttt tggagctgcc gaccgagata 180 
tcagaggcca cccacccggt gttggccacc atgctgagca agtacacgcg catgtccagc 240 
ctgtttaatg acaagtgcgc ctttaagctg gacctgttgc gcatggtagc cgtgtcgcgc 300 
acccggcgcc atcatcatca tcatcattaa taaactaatc cttaacattc tactcccaac 360 
cccttggggc ctctaaacgg gtcttgaggg gttttttg 398 



<210> 52 
<211> 632 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence: 
Expresionskonstrukt Mutante 1 

<400> 52 

gaaattaata cgactcacta tagggagacc acaacggttt ccctctagaa ataattttgt 60 

ttaactttaa gaaggagata taccatgaaa tatacatatt ctctgcacgt gatcgtgcag 120 

ggtgccccga cgttgccccc tgcctggcag ccctttctca aggaccaccg catctctaca 180 

ttcaagaact ggcccttctt ggagggctgc gcctgcaccc cggagcggat ggccgaggct 240 
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ggcttcatcc actgccccac tgagaacgag ccagacttgg cccagtgttt cttctgcttc 300 
aaggagctgg aaggctggga gccagatgac gaccccatag aggaacataa aaagcattcg 360 
tccggttgcg ctttcctttc tgtcaagaag cagtttgaag aattaaccct tggtgaattt 420 
ttgaaactgg acagagaaag agccaagaac aaaattgcaa aggaaaccaa caataagaag 4 80 
aaagaatttg aggaaactgc gaagaaagtg cgccgtgcca tcgagcagct ggctgccatg 54 0 
gatcatcatc atcatcatca ttaataaact aatccttaac attctactcc caaccccttg 600 
gggcctctaa acgggtcttg aggggttttt tg 632 



<210> 53 
<211> 599 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence: 
Expressionskonstrukt Wildtyp 

<400> 53 

gaaattaata cgactcacta tagggagacc acaacggttt ccctctagaa ataattttgt 60 
ttaactttaa gaaggagata taccatgggt gccccgacgt tgccccctgc ctggcagccc 120 
tttctcaagg accaccgcat ctctacattc aagaactggc ccttcttgga gggctgcgcc 180 
tgcaccccgg agcggatggc cgaggctggc ttcatccact gccccactga gaacgagcca 240 
gacttggccc agtgtttctt ctgcttcaag gagctggaag gctgggagcc agatgacgac 300 
cccatagagg aacataaaaa gcattcgtcc ggttgcgctt tcctttctgt caagaagcag 360 
tttgaagaat taacccttgg tgaatttttg aaactggaca gagaaagagc caagaacaaa 420 
attgcaaagg aaaccaacaa taagaagaaa gaatttgagg aaactgcgaa gaaagtgcgc 480 
cgtgccatcg agcagctggc tgccatggat catcatcatc atcatcatta ataaactaat 540 
ccttaacatt ctactcccaa ccccttgggg cctctaaacg ggtcttgagg ggttttttg 599 



<210> 54 
<211> 1400 
<212> DNA 

<213> Artificial Sequence 



<220> 

<223> Description of Artificial Sequence: 
Expressionskonstrukt Mutante 1 



<400> 54 

gaaattaata cgactcacta tagggagacc 
ttaactttaa gaaggagata taccatgaaa 
gagttggggc ccctagaagg tggctacctg 
tgcctctacc acttctatga ccagatggac 
tcagaacccg acacagacac catcaactgc 
gaaggtgatg aagagaccag ggaggcttat 
ttccaggact cccagctgga gggcctgagc 



acaacggttt ccctctagaa ataattttgt 60 

tatacatatt ctctgcacgt gatcgtgcag 120 

gagcttctta acagcgatgc tgaccccctg 180 

ctggctggag aagaagagat tgagctctac 240 

gaccagttca gcaggctgtt gtgtgacatg 300 

gccaatatcg cggaactgga ccagtatgtc 360 

aaggacattt tcaagcacat aggaccagat 420 



WO 2004/053053 ^ ^T/EP2003/0 13964 

mf 16/18 

gaagtgatcg gtgagagtfT ggagatgcca gcagaagttg ggcagaaaag tcagaaaaga 480 
cccttcccag aggagcttcc ggcagacctg aagcactgga agccagctga gccccccact 54 0 
gtggtgactg gcagtctcct agtgggacca gtgagcgact gctccaccct gccctgcctg 600 
ccactgcctg cgctgttcaa ccaggagcca gcctccggcc agatgcgcct ggagaaaacc 660 
gaccagattc ccatgccttt ctccagttcc tcgttgagct gcctgaatct ccctgaggga 720 
cccatccagt ttgtccccac catctccact ctgccccatg ggctctggca aatctctgag 780 
gctggaacag gggtctccag tatattcatc taccatggtg aggtgcccca ggccagccaa 840 
gtaccccctc ccagtggatt cactgtccac ggcctcccaa catctccaga ccggccaggc 900 
tccaccagcc ccttcgctcc atcagccact gacctgccca gcatgcctga acctgccctg 960 
acctcccgag caaacatgac agagcacaag acgtccccca cccaatgccc ggcagctgga 1020 
gaggtctcca acaagcttcc aaaatggcct gagccggtgg agcagttcta ccgctcactg 1080 
caggacacgt atggtgccga gcccgcaggc ccggatggca tcctagtgga ggtggatctg 1140 
gtgcaggcca ggctggagag gagcagcagc aagagcctgg agcgggaact ggccaccccg 1200 
gactgggcag aacggcagct ggcccaagga ggcctggctg aggtgctgtt ggctgccaag 1260 
gagcaccggc ggccgcgtcg actcgagcga gctcccgggg ggggttctca tcatcatcat 1320 
catcattaat aataaactaa tccttaacat tctactccca accccttggg gcctctaaac 1380 
gggtcttgag gggttttttg 140Q 



<210> 55 
<211> 1367 
<212> DNA 

<213> Artificial Sequence 



<220> 

<223> Description of Artificial Sequence: 
Expressionskonstrukt Wildtyp 



<400> 55 

gaaattaata cgactcacta tagggagacc 
ttaactttaa gaaggagata taccatggag 
cttcttaaca gcgatgctga ccccctgtgc 
gctggagaag aagagattga gctctactca 
cagttcagca ggctgttgtg tgacatggaa 
aatatcgcgg aactggacca gtatgtcttc 
gacattttca agcacatagg accagatgaa 
gaagttgggc agaaaagtca gaaaagaccc 
cactggaagc cagctgagcc ccccactgtg 
agcgactgct ccaccctgcc ctgcctgcca 
tccggccaga tgcgcctgga gaaaaccgac 
ttgagctgcc tgaatctccc tgagggaccc 
ccccatgggc tctggcaaat ctctgaggct 
catggtgagg tgccccaggc cagccaagta 
ctcccaacat ctccagaccg gccaggctcc 
ctgcccagca tgcctgaacc tgccctgacc 
tcccccaccc aatgcccggc agctggagag 
ccggtggagc agttctaccg ctcactgcag 
gatggcatcc tagtggaggt ggatctggtg 



acaacggttt ccctctagaa ataattttgt 60 
ttggggcccc tagaaggtgg ctacctggag 120 
ctctaccact tctatgacca gatggacctg 180 
gaacccgaca cagacaccat caactgcgac 24 0 
ggtgatgaag agaccaggga ggcttatgcc 300 
caggactccc agctggaggg cctgagcaag 360 
gtgatcggtg agagtatgga gatgccagca 420 
ttcccagagg agcttccggc agacctgaag 4 80 
gtgactggca gtctcctagt gggaccagtg 54 0 
ctgcctgcgc tgttcaacca ggagccagcc 600 
cagattccca tgcctttctc cagttcctcg 660 
atccagtttg tccccaccat ctccactctg 720 
ggaacagggg tctccagtat attcatctac 780 
ccccctccca gtggattcac tgtccacggc 84 0 
accagcccct tcgctccatc agccactgac 900 
tcccgagcaa acatgacaga gcacaagacg 960 
gtctccaaca agcttccaaa atggcctgag 1020 
gacacgtatg gtgccgagcc cgcaggcccg 1080 
caggccaggc tggagaggag cagcagcaag 1140 
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agcctggagc gggaactggc caccccggac tgggcagaac ggcagctggc ccaaggaggc 1200 

ctggctgagg tgctgttggc tgccaaggag caccggcggc cgcgtcgact cgagcgagct 12 60 

cccggggggg gttctcatca tcatcatcat cattaataat aaactaatcc ttaacattct 1320 

actcccaacc ccttggggcc tctaaacggg tcttgagggg ttttttg 1367 



<210> 56 
<211> 938 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial 

Sequence : Expressionskonstrukt 

<400> 56 

gaaattaata cgactcacta tagggagacc acaacggttt ccctctagaa ataattttgt 60 
ttaactttaa gaaggagata taccatgaaa tatacatatt ctctgcacgt gatcgtgcag 120 
actagcaaag gagaagaact tttcactgga gttgtcccaa ttcttgttga attagatggt 180 
gatgttaatg ggcacaaatt ttctgtcagt ggagagggtg aaggtgatgc tacatacgga 240 
aagcttaccc ttaaatttat ttgcactact ggaaaactac ctgttccatg gccaacactt 300 
gtcactactt tctcttatgg tgttcaatgc ttttcccgtt atccggatca tatgaaacgg 360 
catgactttt tcaagagtgc catgcccgaa ggttatgtac aggaacgcac tatatctttc 420 
aaagatgacg ggaactacaa gacgcgtgct gaagtcaagt ttgaaggtga tacccttgtt 4 80 
aatcgtatcg agttaaaagg tattgatttt aaagaagatg gaaacattct cggacacaaa 540 
ctcgagtaca actataactc acacaatgta tacatcacgg cagacaaaca aaagaatgga 600 
atcaaagcta acttcaaaat tcgccacaac attgaagatg gatccgttca actagcagac 660 
cattatcaac aaaatactcc aattggcgat ggccctgtcc ttttaccaga caaccattac 720 
ctgtcgacac aatctgccct ttcgaaagat cccaacgaaa agagagacca catggtcctt 780 
cttgagtttg taacagctgc tgggattaca catggcatgg atgaactata caaacccggg 840 
gggggttctc atcatcatca tcatcattaa taaactaatc cttaacattc tactcccaac 900 
cccttggggc ctctaaacgg gtcttgaggg gttttttg 938 



<210> 57 
<211> 905 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description of Artificial Sequence: 
Expressionskonstrukt 

<400> 57 

gaaattaata cgactcacta tagggagacc acaacggttt ccctctagaa ataattttgt 60 

ttaactttaa gaaggagata taccatgact agcaaaggag aagaactttt cactggagtt 120 

gtcccaattc ttgttgaatt agatggtgat gttaatgggc acaaattttc tgtcagtgga 180 

gagggtgaag gtgatgctac atacggaaag cttaccctta aatttatttg cactactgga 240 
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aaactacctg ttccatggC^aacacttgtc actactttct cttatggtgt tcaatgcttt 300 
tcccgttatc cggatcatat gaaacggcat gactttttca agagtgccat gcccgaaggt 360 
tatgtacagg aacgcactat atctttcaaa gatgacggga actacaagac gcgtgctgaa 420 
gtcaagtttg aaggtgatac ccttgttaat cgtatcgagt taaaaggtat tgattttaaa 480 
gaagatggaa acattctcgg acacaaactc gagtacaact ataactcaca caatgtatac 540 
atcacggcag acaaacaaaa gaatggaatc aaagctaact tcaaaattcg ccacaacatt 600 
gaagatggat ccgttcaact agcagaccat tatcaacaaa atactccaat tggcgatggc 660 
cctgtccttt taccagacaa ccattacctg tcgacacaat ctgccctttc gaaagatccc 720 
aacgaaaaga gagaccacat ggtccttctt gagtttgtaa cagctgctgg gattacacat 780 
ggcatggatg aactatacaa acccgggggg ggttctcatc atcatcatca tcattaataa 840 
actaatcctt aacattctac tcccaacccc ttggggcctc taaacgggtc ttgaggggtt 900 



ttttg 



905 



